在原因指导的非循环图(DAG)的结构学习问题中出现的良好研究挑战是,使用观测数据,一个人只能将图形到“马尔可夫等价类”(MEC)。剩余的无向边缘必须使用干预率定向,这可以在应用中执行昂贵。因此,最小化了全面定向MEC所需的干预次数的问题已经得到了很多最近的关注,并且也是这项工作的重点。我们证明了两个主要结果。第一个是一种新的通用下限,在任何算法(无论是主动或被动)需要执行的原子干预次数,以便定向给定的MEC。我们的第二个结果表明,这一界限实际上是可以定位MEC的最小原子干预措施的两个大小的因素。我们的下限比以前已知的下限更好。我们的下限证明是基于CBSP订购的新概念,这是没有V-Surructure的DAG的拓扑排序,并满足某些特殊属性。此外,在综合图上使用模拟,并通过赋予特殊图家庭的示例,我们表明我们的界限往往明显更好。
translated by 谷歌翻译
Supervised approaches generally rely on majority-based labels. However, it is hard to achieve high agreement among annotators in subjective tasks such as hate speech detection. Existing neural network models principally regard labels as categorical variables, while ignoring the semantic information in diverse label texts. In this paper, we propose AnnoBERT, a first-of-its-kind architecture integrating annotator characteristics and label text with a transformer-based model to detect hate speech, with unique representations based on each annotator's characteristics via Collaborative Topic Regression (CTR) and integrate label text to enrich textual representations. During training, the model associates annotators with their label choices given a piece of text; during evaluation, when label information is not available, the model predicts the aggregated label given by the participating annotators by utilising the learnt association. The proposed approach displayed an advantage in detecting hate speech, especially in the minority class and edge cases with annotator disagreement. Improvement in the overall performance is the largest when the dataset is more label-imbalanced, suggesting its practical value in identifying real-world hate speech, as the volume of hate speech in-the-wild is extremely small on social media, when compared with normal (non-hate) speech. Through ablation studies, we show the relative contributions of annotator embeddings and label text to the model performance, and tested a range of alternative annotator embeddings and label text combinations.
translated by 谷歌翻译
临床前和临床领域中的结构化(表格)数据包含有关个人的有价值信息,有效的表格到文本摘要系统可以大大减少手动努力,以将该数据凝结到报告中。但是,实际上,该问题受到最先进的自然语言生成模型(包括T5,Pegasus和GPT-NEO)的数据稀疏性和无法产生准确可靠的输出的严重阻碍。在本文中,我们提出了一种新颖的桌面到文本方法,并通过新颖的两步结构解决这些问题,通过自动校正,复制机制和合成数据增强来增强这些问题。研究表明,所提出的方法从结构化数据中选择了显着的生物医学实体和值,以提高精度(最高0.13个绝对增加),以复制表格值,以生成相干和准确的文本以进行测定验证报告和毒理学报告。此外,我们还通过微调示例进行微调来展示提出的系统对新数据集的轻量重量改编。我们模型的输出在人类的场景中得到了人类专家的验证。
translated by 谷歌翻译
电子智能(elint)通常被称为电子智能,是通过电子传感器获得的智能。除了个人通信之外,通常获得闪烁的智慧。目标通常是确定目标的能力,例如雷达放置。可以采用主动或无源传感器来收集数据。分析提供的信号并与收集的识别信号类型的数据进行对比。如果检测到信号类型,则可以存储信息;如果未找到匹配项,它可以被归类为新的。 elint收集和分类数据。在军事环境中(以及通过这样的其他公司),智力有助于组织做出决定,可以在竞争中为他们提供战略优势。术语“英特尔”经常缩短。信号智能(SIGINT)的两个主要子场是elint和通信智能(Comint)。美国国防部指定术语,情报社区使用全球审查的数据类别。
translated by 谷歌翻译
目的:临床票据含有其他地方未存在的信息,包括药物反应和症状,所有这些都在预测急性护理患者的关键结果时非常重要。我们提出了从临床笔记中的表型作为一种捕获基本信息的方法的自动注释,这与通常使用生命体征和实验室测试结果的互补性,以预测重症监护单元(ICU)中的结果。方法:我们开发一种新颖的表型注释模型,用于注释患者的表型特征,然后用作预测模型的输入特征,以预测ICU患者结果。我们展示并验证了我们的方法对三个ICU预测任务进行实验,包括使用MIMIC-III数据集的医院死亡率,生理失效和超过24,000名患者的逗留时间。结果:掺入表型信息的预测模型实现0.845(AUC-ROC),以预测医院死亡率,0.839(AUC-ROC)的生理失代偿和0.430(Kappa),所有这些都始终胜过基线模型利用只有生命的迹象和实验室测试结果。此外,我们进行了彻底的解释性研究,表明表型在患者和队列水平方面提供了有价值的见解。结论:该方法表明表型信息是传统上使用生命体征和实验室测试结果的补充,改善了ICU中的结果的重要预测。
translated by 谷歌翻译